#GoogleDeepMind CEO | 熱門關鍵字 | 鉅亨號

ChatGPT發佈距今已近36個月，面對OpenAI的領先，哈薩比斯帶領GoogleAI全面反攻，通過新發佈的Gemini 3強勢回歸。Gemini 3在LM Arena等多個模型榜單登頂，表現優於GPT-5及其他模型，上演了一場完美逆襲。大模型排行榜，你方唱罷我登場。馬斯克的Grok 4.1剛登頂，隨後就被Gemini 3 Pro反超了，上演了一幕AI版的「速度與激情」！Google DeepMind CEO哈薩比斯（Demis Hassabis）哈薩比斯在X平台上興奮地曬出Gemini 3的成績單，稱其「當然地」登頂各大排行榜，並表示這是自己迄今為止最愛的模型。就連奧特曼和馬斯克，也紛紛為Gemini 3點贊。馬斯克連發兩個哭泣的表情包：看來我們要盡快推Grok 4.2了。新發佈的Gemini 3具備領先的推理、多媒體處理和編碼能力，擅長推理、生成視訊和寫程式碼。Google強調，Gemini 3不只是一個更聰明的模型或聊天機器人，更重要的是它從發佈之日起，就開始全面增強Google現有產品，包括其利潤可觀的搜尋業務。它是Google這台龐大的賺錢機器的AI引擎，用哈薩比斯的話說：「我們是Google的動力引擎，現在我們正在讓AI全面接入」。哈薩比斯認為目前確實可能存在AI泡沫的問題，比如許多尚未經過檢驗的初創公司卻拿到了數十億美元的估值。但在他看來，即便是AI泡沫真的破裂，Gemini 3也讓Google有了穿越這場泡沫的底氣。把Google搜尋塞進GeminiGoogle內部，一直有一個把Google搜尋「塞」進Gemini的想法。這一想法，甚至可以追溯到Google早期。當時的Larry Page和Sergey Brin就設想過把整個網際網路都放進AI的「記憶」中，然後再對外提供服務。因此，Google在上下文方面做了大量實驗，並將上下文窗口提升到了100萬個token，目前這個記錄仍沒真正被人打破。哈薩比斯認為，機器理論上可以擁有比人類多幾百萬倍的儲存/記憶空間，但如果只是「天真地」把所有東西暴力存下來，其實並不高效。因此，與Google搜尋「塞」進Gemini相比，Google更多是把Gemini作為現有產品的底層模型向使用者開放。此次Gemini 3一發佈，Google已經正式通過Gemini應用，以及Google搜尋中的AI Overviews功能向使用者開放。據Google母公司Alphabet在7月的季度財報中表示，AI Overviews推動搜尋查詢量提升了10%。同時，Google視覺搜尋也出現了70%的激增，這項功能依賴於Gemini對照片的分析能力。與OpenAI相比，Google的優勢在於其產品「家底」深厚。它擁有包括搜尋、Google地圖、Gmail、雲服務等非常廣泛的基礎產品線。而且，Google很早就開始利用AI來增強其已有產品的能力。這使得它在與OpenAI、xAI、Anthropic等AI廠商的競爭中進可攻，退可守。哈薩比斯表示，「在不利的情況下，我們會更加依靠這些基礎產品；在有利的情況下，我們擁有最全面的佈局和最具前瞻性的研究。」Google也在考慮通過Gemini重啟Google眼鏡（Google Glass）項目。哈薩比斯表示，當時Google眼鏡步子邁得有點超前，缺少一個真正的「殺手級用例」，而通用助手正是這樣一個用例。因此，未來Gemini也將啟動Google以往積累下來的「經驗和遺產」，但是重點會放在「世界理解」上。以Gemini為例，Google一開始就將機器人和眼鏡視為兩個非常重要的應用場景，因此決定走多模態路線。如今，這些押注正在逐漸顯現出成果，Gemini已經在多模態理解上顯現出明顯優勢。除了用AI增強現有和以往的產品之外，Google也在積極利用AI打造越來越受歡迎的新工具。比如，NotebookLM，它可以根據文字材料自動生成播客；AI Studio，可以借助AI快速生成應用原型，等等。此外，Google還探索將這項技術應用到遊戲、機器人等領域。哈薩比斯提到GoogleAI的一個優勢，目前所有產品已經完全跑在Gemini技術堆疊上，實現了從產品到模型的「一體化」。這意味著無論是產品改動，還是模型微調都會容易很多，而且產品也可以更好地學會理解和使用底層模型。目前，哈薩比斯的重要精力，一半是將Gemini應用進一步加速做強，另一方面是將AI融入Google的各條業務線，使之成為Google的「AI動力艙」。「我對這一切非常興奮，目前我們只是剛剛觸及未來可能性的表面，明年會更直觀地看到這些變化」。哈薩比斯表示。被OpenAI「搶跑」後Google正快速趕上Google在AI領域長期投入巨大資源，並取得了一系列關鍵性突破。包括在2017年發現了Transformer模型架構，但沒有將其商業化，而是選擇把它公開。一直到2022年，OpenAI基於Transformer的ChatGPT爆火，動搖了Google的核心搜尋業務，才令它深受震動，開始奮起直追。有意思的是，OpenAI的崛起，不僅喚醒了Google在AI領域的加速發展，甚至還間接幫助Google避免了被分拆，出售其搜尋業務的命運。如今，Google的搜尋業務不僅沒有被OpenAI等AI新勢力所顛覆，相反它的AI模型還實現了對後者的反超。與Gemini3相比，OpenAI在8月份發佈的GPT-5令人略顯失望。一些評論者認為它「表現平平」，使用者也抱怨其風格變得更正式。據Google表示，Gemini 3在LM Arena等多個模型榜單上的表現優於GPT-5及其他模型，尤其在模擬推理以及長時間規劃方面表現更佳，這有助於提升依賴工具或網際網路的AI智能體的實際能力。在早期的AI競賽中，經歷過一些磕磕絆絆之後，Google總算是「漸入佳境」了。從使用者活躍度上看，Gemini應用的月活使用者已超過6.5億，僅次於ChatGPT的7-8億周活使用者（如果換算成月活可能在10億以上）。每月有超過20億人通過搜尋裡的AI Overviews使用Gemini；還有約1300萬開發者在自己的產品中整合了Gemini。這些數字表明Google正在逐漸縮短與OpenAI在AI領域的差距，作為GoogleAI總負責人的哈薩比斯也可以鬆口氣了。各方面都最強才叫AGI實現還要5-10年哈薩比斯表示，Google仍然在追求做「各方面都最強」的模型。在他看來，這才是真正意義上的通用模型，也是最終通向通用人工智慧（AGI）系統的關鍵組成部分。從之前的幾個版本到Gemini3，Google一直在修正Gemini模型的一些短板，使其在程式設計、推理、數學等能力上更進一步。比如，此次Gemini 3就在2.5之上迭代，一方面升級它的基礎能力，另一方鞏固在多模態領域的優勢。哈薩比斯認為未來AI的技術路線會越來越收斂，而擁有一個通用、全能的基礎模型將是一切的地基。除此次發佈的Gemini3 Pro外，Gemini模型家族裡的其他成員也在打磨中，等到這些模型陸續就位之後，Google還將在產品分層服務上提供更大的靈活度。簡單來說，就是更強的性能，更低的價格。正如哈薩比斯所言：「大方向是每一代新模型，都要在整體能力上更強，同時所需算力更便宜、更高效，帶來更有競爭力的價格和更低的時延」。目前，哈薩比斯在世界模型研究上花時間最多，在他看來這是通往AGI的關鍵元件。同樣，他也認為未來世界模型也將迎來類似ChatGPT那樣的「爆發時刻」。但最大的挑戰是推理/服務成本，以及還要解決在更長時間尺度上保持世界一致性等關鍵難題，才能迎來真正的「破圈」時刻。哈薩比斯表示，目前世界模型已經有了一些內部用例，比如用來訓練其他智能體、機器人系統等。未來可能會出現一些非常酷的外部應用場景。哈薩比斯仍然堅持他對通用人工智慧（AGI）時間表的預測。他認為距離真正意義上的完全實現AGI還有五到十年，而Gemini 3將成為未來打造更強大AI的重要平台，還需要在現有模型不斷變強的基礎上再取得一兩次關鍵性突破。在通往AGI的路上，哈薩比斯同樣也有算力焦慮。他坦言「即便將現在全世界的算力加在一起，也不夠滿足我們想做的所有事情」。因此，需要在不同項目之間衡量算力投入的回報。比如，研究上的收益、新產品探索的價值，或是直接的收入等。除了追求AGI，哈薩比斯還在帶領DeepMind在AlphaEvolve等一些科學領域進一步擴展。穿越AI泡沫的底氣談到AI泡沫，哈薩比斯整體上還是比較樂觀的，但他認為仍然存在一定的泡沫。「那些幾乎沒有什麼的項目，種子輪估值就能到幾十億美元，這在邏輯上有點行不通。」對比這些泡沫，哈薩比斯認為Google的位置非常好。就DeepMind而言，既有紮實營收，同時又承擔著Google「AI動力艙」的重任；既有Gemini模型及App，還有基於Gemini的NotebookLM等AI優先產品。哈薩比斯表示，目前AI已經在Google現有業務中看到了立竿見影的回報：正在為搜尋、YouTube、雲等業務「加功率」。作為DeepMind的聯合創始人，哈薩比斯早在12年前選擇與Google「聯手」時，已經考量過雙方合作的價值：Google可以提供海量的算力資源，同時它的產品又天然適合用AI去增強。目前，這條路正一步步變成現實。在哈薩比斯看來，Google與DeepMind的結合，讓現在的Google在AI競爭中處於一個非常有利的位置，使它有機會穿越泡沫，笑到最後。 (新智元)